SLA概述

服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。

背景信息

PTS制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板

除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。具体操作,请参见配置SLA

名词解释

在使用该功能时,请先了解PTS对于SLA相关名词的说明。

  • SLA

    • 服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。

  • SLA指标

    • SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDSSLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。

  • SLA规则

    • SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。

  • SLA模板

    • SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。

SLA指标

SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。

SLA指标类型

SLA指标项

SLA指标项说明

最小监控粒度

业务质量相关指标

RT (Response Time)

压测中API的响应时间。

1

RPS (Requests per Second)

压测中,每秒发出的压测请求数量。

成功率

压测中API的请求成功率。

ECS基础监控相关指标

CPU利用率

CPU使用率,指一段时间内CPU被占用的情况。

1分钟

内存利用率

一段时间内内存被占用的情况。

load5

5分钟内系统的平均负荷。

RDS基础监控相关指标

CPU利用率

CPU使用率,指一段时间内CPU被占用的情况。

5分钟

连接利用率

连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。

SLB基础监控相关指标

丢弃连接数

端口丢弃的连接数,从IP:Port维度进行统计。

1分钟

异常后端Server

例如,后端异常ECS实例个数